A análise foi feita com base nos dados sobre as atividades dos representantes federais no twitter em 2019. Os campos utilizados aqui foram: o identificador do parlamentar, a casa, o partido, a UF, a quantidade de seguidores e o engajamento total(quantidade de likes e retweets para os tweets vistos).

atividade = read_projectdata()
tail(atividade)
## # A tibble: 6 x 19
##   id_parlamentar casa  nome_eleitoral partido UF    twitter seguidores
##   <chr>          <chr> <chr>          <chr>   <chr> <chr>        <dbl>
## 1 5899           sena… VANDERLAN CAR… PP      GO    Vander…       7065
## 2 5748           sena… VENEZIANO VIT… PSB     PB    venezi…      16045
## 3 1173           sena… WELLINGTON FA… PR      MT    sen_we…       5507
## 4 5411           sena… WEVERTON       PDT     MA    wevert…       7821
## 5 5783           sena… ZENAIDE MAIA   PROS    RN    zenaid…         NA
## 6 3806           sena… ZEQUINHA MARI… PSC     PA    Zequin…        126
## # ... with 12 more variables: segue <dbl>, n_proprio <dbl>,
## #   n_retweet <dbl>, engaj_total <dbl>, engaj_total_proprio <dbl>,
## #   engaj_total_retweet <dbl>, engaj_mediano <dbl>,
## #   engaj_mediano_proprio <dbl>, engaj_mediano_retweet <dbl>,
## #   engaj_max <dbl>, engaj_max_proprio <dbl>, engaj_max_retweet <dbl>

Primeira Pergunta: Os partidos com mais deputados têm, proporcionalmente, mais seguidores?

Aqui pretende-se ver se a quantidade de deputados representando um partido torna-o mais popular no Twitter ou se poucos indivíduos podem despontar a quatidade de seguidores por todo partido. Além dos partidos, adicionou-se a informação do posicionamento ideológico para talvez identificar uma relação, adicional com o número de seguidores.

totais <- atividade %>% 
  filter(!is.na(seguidores) & casa == "câmara") %>%
  summarize(n_politicos = n(),
            n_seguidores = sum(seguidores))
seguidores <- atividade %>% 
  select(id_parlamentar, partido, seguidores) %>%
  filter(!is.na(seguidores))%>%
  group_by(partido) %>%
  summarize(QntPoliticos = n(),
            QntSeguidores = sum(seguidores),
            Proporcao = round(QntPoliticos*100/totais$n_politicos, 2),
            Seguidores = round(QntSeguidores*100/totais$n_seguidores,2))

Com exceção do PSOL, percebe-se que há linearidade entre a proporção de deputados federais do partido na câmara e a quantidade de seguidores, também por partido. O que não parece depender da ideologia

ggplotly(partido_posicao %>%
  ggplot() +
  geom_point(aes(x= Proporcao, text=sprintf("Partido: %s",partido), y = Seguidores, color = posicao), alpha=.7, size = 4))

Segunda Pergunta: A média do engajamento depende do partido?

Já se sabe que, de modo geral, a quantidade de seguidores cresce à medida que se aumenta a quantidade de seguidores para a câmara. Mas de modo geral, as pessoas participam igualmente dos twitter de representantes do mesmo partido? Ou a ideologia não é um fator tão importante quanto o indivíduo político?

atividade %>% 
  filter(!is.na(engaj_total)) %>%
  select(id_parlamentar, partido, engaj_total) %>%
  ggplot(aes(x=partido, y = engaj_total)) +
  geom_boxplot() +
  geom_point(alpha=0.2, color='orange') + 
  theme(axis.text.x = element_text(angle = 90)) +
  labs(x = "Partido", y="Engajamento Total", title="Engajamento por partido")

A maioria dos partidos, como pode-se ver acima, possui engajamento uniforme com algumas exceções. Paulo Eduardo Martins, jornalista do PSC, Carla Zambelli, Bia Kicis, Joice Hasselmann, do PSL e Maria do Rosário, Gleisi Hoffmann, Enio Verri, do PT, por exemplo. Cada um indivíduos dissonantes dentro do seu partido.

Terceira Pergunta: Ser mais engajado/ativo depende do estado que se representa?

Alguns estados são mais engajados do que outro, em média. Como esperado, estados populosos, como Rio de Janeiro e São Paulo, e o Distrito Federal são mais ativos. Amapá e Rio Grande do Norte, por outro lado, são surpresas pois aparecem acima de estados populosos como Bahia e Minas Gerais.

atv_total <- atividade %>%
  select(UF, engaj_total) %>%
  filter(!is.na(engaj_total)) %>%
  group_by(UF) %>%
  mutate(atv = mean(engaj_total)) %>%
  distinct(UF, .keep_all = T) %>% 
  select(-engaj_total) %>%
  arrange(UF) %>%
  ungroup() %>%
  mutate(regiao = c("NORTE", "NORDESTE", "NORTE", "NORTE", "NORDESTE", "NORDESTE", "CENTRO", "SUDESTE", "CENTRO", "NORDESTE", "SUDESTE", "CENTRO", "CENTRO", "NORTE", "NORDESTE", "NORDESTE", "NORDESTE", "SUL", "SUDESTE", "NORDESTE", "NORTE", "NORTE","SUL", "SUL", "NORDESTE", "SUDESTE", "NORTE"))

ggplot() +
  geom_point(atv_total, mapping= aes(x=UF, y=atv, color=regiao), size = 3 ) +
  geom_point(atividade, mapping= aes(x=UF, y=engaj_total), alpha = .08, color = 'navy') +
  ylim(0, 250000) +
  labs(title = "Engajamento do partido pelo estado e região do país", y = "Engajamento")

Quarta pergunta: Qual é o partido com maior número de likes e retweets?

O vermelho é o total de atividade, likes e retweets, do partido e, em azul, as atividades individuais dos representantes. O resultado não é surpreendente, os representantes mais dissonantes vistos nos boxplots, provavelmente, puxam os valores dos seus partidos: PSL, muito acima dos demais, PT e PSOL.

atv_total <- atividade %>%
  select(partido, engaj_total) %>%
  filter(!is.na(engaj_total)) %>%
  group_by(partido) %>%
  mutate(atv = sum(engaj_total)) %>%
  distinct(partido, .keep_all = T) %>% 
  select(-engaj_total) 

ggplot() +
  geom_point(atv_total, mapping= aes(x=reorder(partido, atv), y=atv), size = 3, color='red', alpha = .6 )+
  geom_point(atividade, mapping= aes(x=partido, y=engaj_total), alpha = .1, color = 'navy') + 
  theme(axis.text.x = element_text(angle = 90)) +
  labs(x = "Partido", y = "Atividade", title = "Atividade total por partido")